首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏windealli

    LLM Agent 简介

    本文将介绍LLM Agent相关的概念、组成及应用,帮助Agents初学者更好的理解和应用LLM Agent。本文部分内容梳理/翻译自参考文献中的文章。 LLM Agent 概念定义关于LLM Agent, OpenAI 应用人工智能研究负责人Lilian Weng在其Blog中将LLM Agent定义为LLM、记忆(Memory)、任务规划(Planning LLM Agent通过迭代运行并定义一些新的目标/任务,而非传统GPT那般接受单个查询的输入并返回输出LLM Agent 常见功能LLM Agent能够基于大语言模型进行对话、完成任务、推理,并可以展示一定程度的自主行为 根据需要,LLM Agent可以提供丰富的功能,下面是LLM Agent 常见的功能: 利用LLM本身的语言能力理解指令、上下文和目标利用Tools(工具套件,如计算器、API、搜索引擎等)来收集信息并采取行动完成分配的任务 LLM 与 三个组件LLM AgentLLM 驱动,并需要三大组件辅助以完成工作(图片来自: https://lilianweng.github.io/posts/2023-06-23-agent

    7.1K23编辑于 2024-01-12
  • AIOS --LLM Agent Operating System

    所谓的AI驱动实际是集成了一个简单的Q&A的AI agent。 那么如果在系统中集成了多个AI agent,整个系统会是什么样的? 智能体 (Agent / MCP Host): 这是系统的核心行为单元,是我们团队中的“员工”或”专家”。比如图中的 Agent A 和 Agent B。 智能体协作 (通过 A2A(Agent2Agent) 协议): 当一项任务过于复杂,单个智能体 A 无法独立完成时,它需要与其他智能体(如图下方的 Agent B)协作。 在arXiv上有一篇论文arXiv:2403.16971v2 “ AIOS: LLM Agent Operating System”该论文已经被COLM 2025接收,同时其也开源了相关source code 通过将LLM实例抽象为核心并实现标准化系统调用,AIOS凭借LLM核心的模块化设计,为整合不同部署选项下的LLM实例提供了灵活解决方案。

    18810编辑于 2026-03-18
  • 来自专栏AgenticAI

    LLM Agent标准化互操作协议:Agent Protocol

    代理协议是我们尝试规范化用于在生产环境中服务 LLM 代理的框架无关 API。本文档解释了该协议的目的,并阐述了每个端点的必要性。最后,我们列出了未来的一些发展路线。 为什么选择代理协议 如何为 LLM 应用程序在生产环境中提供正确的 API? 参考资料 [1] 这里:https://langchain-ai.github.io/agent-protocol/api.html [2] 这里:https://langchain-ai.github.io /agent-protocol/openapi.json [3] LangGraph平台:https://www.langchain.com/pricing-langgraph-platform [4] GET /threads/{thread_id}/runs:https://langchain-ai.github.io/agent-protocol/api.html#tag/runs/GET/threads

    35810编辑于 2025-03-18
  • 来自专栏计算机工具

    LLM前言:推理加速、模型微调对齐、开源LLMAgent、多模态

    LLM前言:推理加速、模型微调/对齐、开源LLMAgent、多模态 推理加速 推理加速是AI技术中的关键环节,能让AI模型在实际应用中更智能、更高效。推理加速技术主要通过算法优化和硬件加速来实现。 开源LLM 开源LLM(大型语言模型)是指公开源代码的大型语言模型,允许开发者自由使用、修改和分发。开源LLM的出现降低了AI技术的门槛,促进了AI技术的创新和发展。 Agent Agent是一种人工智能的概念,通常指具有自主性和交互性的软件实体。它能够感知环境、做出决策并采取行动来完成特定任务。 在更广泛的上下文中,Agent可以是游戏中的角色、智能家居系统中的设备控制程序,或者是复杂的人工智能系统的一部分,负责模拟人类的行为或代表用户与外部系统进行交互。

    39210编辑于 2024-12-14
  • 来自专栏自然语言处理

    Agent未来已来?揭示LLM Agent技术架构与现实挑战

    三、挑战与最佳实践:来自现实世界的挑战 思维导图展示了 LLM Agent生产系统的五大挑战。 LLM Agent的这种“黑匣子”性质需要新的可观察性方法。 这种谨慎和渐进式部署的精神似乎与 LLM 的飞速发展格格不入。但它反映了一种来之不易的认识,即尽管 LLM Agent机构前景光明,但它们仍然非常难以预测,并且可能存在危险。 四、Agent未来方向:超越炒作 尽管各团队每天都在努力应对 LLM Agent部署的挑战,但研究人员仍在不断突破这项技术的极限。 具身Agent 想象一下,一个可以与物理世界互动的 LLM Agent——一个可以理解自然语言指令并将其转化为动作的机器人。

    1.1K10编辑于 2025-01-03
  • 来自专栏NLP/KG

    AI Agent框架(LLM Agent):LLM驱动的智能体如何引领行业变革,应用探索与未来展望

    AI Agent框架(LLM Agent):LLM驱动的智能体如何引领行业变革,应用探索与未来展望1. AI AgentLLM Agent)介绍1.1. Agent 这个词意义、什么是Agent1.2.1 Agent由来有很多人或许会疑惑,Agent 这个东西看起来跟 LLM 也没差得那么远,那为啥最近突然 Agent 那么火,而不称之为 LLM-Application 她提出了 Agent=LLM + 规划技能 + 记忆 + 工具使用的基础架构,其中 LLM 扮演了 Agent 的 “大脑”,在这个系统中提供推理、规划等能力。2.1. 大模型 + 规划: Agent 的 “大脑”, 通过思维链能力实现任务分解LLM 具备逻辑推理能力,Agent 可以将 LLM 的逻辑推理能力激发出来。 AgentBench: LLMAgent 能力评估标准 AgentBench 评价 LLM 作为 Agent 的能力 常用的 LLMAgent 能力排名 清华大学联合团队提出世界首个大模型

    4.8K22编辑于 2024-07-05
  • 来自专栏自然语言处理

    LLM Agent和 Agentic RAG 的最佳综述

    6.1 Agent-G:图RAG的代理框架 核心思想:使用图知识库和反馈循环动态分配任务给专业化代理。 工作流: 从图知识库中提取关系(如疾病到症状的映射)。 补充来自外部源的非结构化数据。 查看笔记本 LlamaIndex, Vertex AI (向量存储, 文本嵌入, LLM), Google Cloud Storage 展示使用LlamaIndex和Vertex AI的单路由器Agentic 此外,语义缓存通过减少对重复或相似用户问题的冗余LLM查询来优化系统,提高响应时间和效率。 查看笔记本 关于Agentic RAG的博客和教程 DeepLearning.AI: 代理如何提高LLM性能。 图增强RAG GeAR: 图增强的检索增强生成代理 https://arxiv.org/abs/2412.18431 Agent-G: 一种图检索增强生成的代理框架 https://openreview.net

    1.3K11编辑于 2025-01-22
  • 来自专栏喔家ArchiSelf

    基于大模型(LLM)的Agent 应用开发

    可对话的Agent设计利用了LLM通过聊天获取反馈并取得进展的强大能力,还允许以模块化的方式组合LLM的功能。 3. Multi-Agent Debate:Multi-Agent Debate试图构建具有多代理对话的LLM应用程序,是鼓励LLM中发散思维的有效方式,并改善了LLM的事实性和推理。 在这两种工作中 ,多个LLM推理实例被构建为多个Agent来解决与Agent争论的问题。每个Agent都是一个LLM推理实例,而不涉及任何工具或人员,并且Agent间的对话需要遵循预定义的顺序。 基于Multi-AgentLLM 应用开发框架:Autogen AutoGen 是一个用于简化 LLM 工作流的编排、优化和自动化的开发框架。 4.1 Autogen 的典型示例 Autogen 使用Multi-Agent会话启用复杂的基于 LLM 的工作流,典型的示例如下: 左图代表基于AutoGen生成的可定制Agent,可以基于LLM

    7.7K33编辑于 2023-10-23
  • 为 AI LLM Agent 构建安全基础

    为 AI / LLM / Agent 构建安全基础——打造可信、可控、可持续的智能生态体系一、引言:智能化浪潮下的“安全底线”2025 年,人工智能正进入自治与智能代理(Agentic AI)时代。 构建一个安全、可信的 AI / LLM / Agent 生态,已成为数字基础设施的重要命题。 系统中权限边界模糊,滥用 API 权限 自动化 Agent 获得管理系统访问权后执行破坏性操作 供应链安全 外部模型 / 插件 / 依赖被篡改 开源 LLM 插件被注入后门 关键设计:多级权限体系:对 LLM、插件、外部 API 设置严格访问边界。Agent Sandbox(沙箱):限制其读写文件、调用系统命令的能力。 ,AI、LLM 与智能 Agent 才能真正成为推动组织智能化、自动化的可信力量。

    4.5K10编辑于 2025-10-11
  • 来自专栏技术汇总专栏

    面向 LLM Agent 的组织模型设计:多 Agent 协同的新范式

    面向LLMAgent的组织模型设计:多Agent协同的新范式一、引言:为什么多Agent系统需要“组织模型”随着人工智能系统从“单智能体”向“群体智能”演进,多Agent系统(Multi-AgentSystem 在自动化调度、智能推荐、机器人集群、软件Agent协作等场景中,单一Agent的感知与决策能力已无法覆盖系统复杂性。然而,当Agent数量增加时,系统面临的问题也随之升级:Agent如何分工? 不同Agent是否拥有相同的决策权限?多个Agent如何避免冲突、实现高效协同? 例如:只有调度Agent才能创建或终止任务执行Agent不能修改全局策略监控Agent只能读取状态,不能写入因此,需要在MAS中引入权限管理机制,以约束Agent的行为边界。 {agent.agent_id}withrole{agent.role}"f"cannotperformaction:{action}")通过在关键操作前进行权限校验,可以有效防止系统级错误。

    32010编辑于 2026-01-12
  • 来自专栏蛋先生说识

    LangChain Agent:赋予 LLM 行动力的神秘力量

    Agent 嘛,当然就像我们的身体。通过 Agent,就可以让 LLM 走起来。 但有了 Agent,这个问题就难不倒它了HowAgent 的基本原理丹尼尔:哇哦,Agent 拥有让 LLM “走”起来的神奇力量,我对它是如何实现的好奇不已! 我只想通过简单地拆解下上面代码的内部工作流程,从而介绍 Agent 是如何运作的第一步,Agent 将用户的问题直接扔给 LLM第二步,LLM 推理出可以使用 get_current_time 这个小工具来回答这个问题 第三步,Agent 将 get_current_time 工具的执行结果呈现给 LLM最后一步,LLM 把工具的输出内容进行总结,然后把答案扔给 Agent。 丹尼尔:LLM 就是“大脑”,Agent 就是“身体”,Tool 就是“手脚”,这下完全理解了。那 LLM 的回答为何可以如此准确呢?蛋先生:这可得感谢 Prompt 工程的功劳!

    1.4K33编辑于 2024-04-02
  • 来自专栏tencent cloud

    【Agentic RL专题】一、LLM agent 与 agentic RL

    agent以及 Agentic RL 两个名词有点混淆,因此,对于这两个名词的解释将作为专题第一章,带你深入理解 LLM agent 以及 Agentic RL的区别@toc一、为什么我们需要 Agentic 在系统的学习agentic RL之前,我们需要去了解两个问题:① 什么是agentLLM agent 与 agentic RL之间有什么联系过去几年,LLM 的飞速发展让语言理解与生成达到了惊人的水平 这正是Agent想要解决的问题。 也就是说,① 现在的大语言模型我们更想让他成为一个智能体Agent,不仅仅是需要让他输出文字,还需要有感知、规划、推理、调用工具、维护记忆、适合策略等的能力。 ——出发,逐步理解了 Agentic RL(智能体强化学习) 的核心思想:从语言到行动:传统的 LLM 只会被动回答,而 Agentic RL 让它学会“感知—思考—行动—反思”,成为真正的智能体(Agent

    1.4K10编辑于 2025-11-07
  • 来自专栏Datawhale专栏

    一文详尽之LLM-Based Agent

    A unified framework for the architecture design of LLM-based autonomous agent from A Survey on Large 通过让 function_call 调用 API,我们轻易就能让 llm 和环境进行交互。然后,各家公司的 agent 模型应运而出,却都像一个没灵魂的躯壳,完全让用户提不起兴趣。问题出在哪里? 其实现在很多系统并不属于真正意义上的“Agent”,Anthropic 对 Agent 是这么定义的:LLM 动态指导自身流程和工具使用,保持对完成任务方式的控制。 写在最后 在完成本文的过程中,发现无论是 Agent 的核心——LLM,还是记忆等模块,都需要阅读更多参考资料、补充更多内容,也会使文章变得非常“膨胀”、冗长,不便于阅读。 因此,本文仅介绍 Agent 相关概念和相关领域的代表作品(例如思维链等),希望在未来能够完成更多的文章,探讨“Agent/LLM是如何推理的?”、“记忆模块是如何工作的?”

    2.8K20编辑于 2025-02-05
  • 来自专栏

    LLM就是框架,Agent就是应用,Workflow就是架构

    LLM是基础设施 前段时间,英伟达发布了自己的本地大模型服务,购买它的显卡,可以直接在硬件上运行一个LLM。 而在AI领域做应用开发,在LLM之前有各种模式,现在LLM已经一统江湖,任何的AI应用,都可以用LLM来开发,这让我们的智能化应用(或者说需要智能化的功能)开发变得极为简单了。 LLM-based AI把这种信息获取的难度拉的极低,以前我们要了解一个知识,需要从一部百科全书图书中去查找,效率和质量都很低,而在LLM的加持下,我们可能只需要10秒钟就可以获得高质量的知识内容。 我认为很多人把Agent的设计看的太过复杂,我认为Agent就是非常简单的输入输出模式,对于我们现有的很多功能,都是可以重新设计为Agent的,甚至有时候不一定需要LLM,只要它能按照某种Agent协议 目前来说,其实我们的LLM基础设施已经很强了,比较欠缺的是Agent,现在的Agent实在是太少了,想要构建AI系统,任何功能(Agent)都需要自己从0去造。当然,或许这也是机会。

    99610编辑于 2024-04-12
  • RAG、LLM、AI Agent到底谁是谁的谁?

    上个月和一个做AI创业的朋友聊天,他苦笑着说:"我现在面试工程师,三句话都离不开LLM、RAG、AI Agent这几个词,但说实话,我自己对这三个概念也不是特别清楚,就是感觉听起来很厉害。" 三、AI Agent:让书呆子变成能动手的行动派 如果说LLM是书呆子,RAG是图书管理员,那AI Agent就是一个能计划、会执行、善反思的行动派。 比如你说"帮我订一张下周一去北京的机票",LLM可能告诉你"建议你提前订票,注意比较价格"之类的话,但AI Agent会真的去查询航班、价格,然后直接帮你下单。 LLM负责思考和推理,RAG负责提供准确的信息,AI Agent负责具体的执行。这就像一个完美的工作团队:聪明的头脑、丰富的信息源、强的执行力。 当然,这个过程也充满挑战。 但当LLM、RAG、AI Agent三者真正协作起来时,这个"未来"就会变得更加触手可及。

    25211编辑于 2026-02-02
  • 来自专栏腾讯云TVP

    o3 deep research: LLM 驱动的 Agent 综述

    LLM 驱动的 Agent在2023年随着 AutoGPT、BabyAGI 等agent早期开源项目而进入大众视野 (Introduction to LLM Agents | NVIDIA Technical Agent 关键技术能力要让 LLM 驱动的 Agent 真正拥有自主解决问题的能力,背后涉及多项关键技术和架构设计。 得益于多模态能力,LLM Agent 正在从“语言专家”成长为“全能型AI”。 多Agent系统的理念是构建一个“AI团队”,让不同专长的Agent各司其职,通过通信协作完成单个Agent无法胜任的复杂目标 (Multi Agent LLM Systems: GenAI Special Agent LLM Systems: GenAI Special Forces)。

    99900编辑于 2025-03-08
  • 来自专栏BPM与RPA观察

    AIGC如何借AI Agent落地?TARS-RPA-Agent破解RPA与LLM融合难题

    当前,AI Agent已是公认大语言模型落地的有效方式之一,它让更多人看清了大语言模型创业的方向,也让投资者们更加看好LLMAgent与已有企业管理软件的融合应用。 说到这里,有人可能会问:超自动化与LLM的融合进展到了什么程度?有没有厂商在做AI Agent方面的尝试?产品体验如何? AI AgentLLM为大脑,再赋予任务规划能力、长短期记忆力、工具使用能力,即可实现自动化处理更复杂的任务。简单来说,AI Agent基于LLM驱动Agent实现对通用问题的自动化处理。 可以说,AI AgentLLM提供了行动能力,真正释放了LLM的潜能。那RPA与AI Agent结合,会有什么样的化合反应呢? 前文讲过AI Agent的核心是LLM,TARS-RPA-Agent所依赖的LLM是实在智能基于通用大模型基座的自研垂直“塔斯(TARS)”大模型。

    1.6K30编辑于 2023-08-23
  • 2026年LLM Agent对比传统Agent终极指南:从规则驱动到认知革命

    当系统流量突然暴增100倍时,传统Agent如流水线上的工人,严格执行预设流程却无力应对突发异常;而新一代的LLM Agent则像拥有思考力的员工,能够理解意图、动态决策。 LLM Agent的工作流程则实现了动态与闭环。 交互与协作方式:传统Agent多为一对一简单交互;LLM Agent支持多智能体协作,多个Agent可分工协商,共同解决宏大问题,开启“数字团队”工作模式。 开发与部署成本:传统Agent针对特定任务开发,改动成本高;LLM Agent基于强大基础模型,快速微调与配置,降低AI应用门槛。 从技术实现来看,现代AI系统常采用LLM+Agent的混合架构。

    59831编辑于 2026-01-20
  • 来自专栏个人博客

    Dynaseal:面向未来端侧llm agentllm api key分发机制 - plus studio - StudyingLover

    为什么要有这个项目 试想一下,在未来 llm agent 在端侧全面铺开,但是目前调用大模型的方式通过了是一个拿到了就可以随便使用的 api-key? 如果每个人的手机都跑着几个 agent,你还有一堆用户,那你服务器岂不是比被 ddos 了还惨,因为 ddos 是不让你提供服务,而这种情况下相当于正常业务还在运行而你被打爆了! 所以,我们提出了缄密 Dynaseal,一个面向未来端侧 agent 模型调用的服务端框架,通过一个类似于 oss 的动态 token,限制端侧 agent 可调用的模型和参数以及 token 存活时间 请求模型 LLM服务端->>LLM服务端: 解包动态key, 确定身份 LLM服务端-->>客户端: 返回响应 LLM服务端->>后端: 通知客户端的请求和响应 动态 key 调用基础上加入了我们的设计-对动态 kay 进行鉴权并响应 backend 业务后端,购买了大模型 api key 的公司/个人提供服务的后端,可以对端侧进行鉴权然后下分 dongtaikey client 端侧,是运行 agent

    33810编辑于 2024-11-08
  • 来自专栏AgenticAI

    LangGraph发表标准化LLM Agent互操作协议

    随着大型语言模型(LLMAgent 的应用日益广泛,这些 Agent 能够执行复杂的任务,如自然语言处理、信息检索和自动化决策。 这些框架和方法各有优势,但也带来了一个挑战:如何实现不同 Agent 之间的有效通信和协作? 1. 多 Agent 的挑战 在多 Agent 中,每个 Agent 可能暴露出不同的 API,这使得标准化通信变得困难。 Agent Protocol 的应运而生 Agent Protocol 应运而生,旨在提供一个框架无关的、标准化的接口,用于 Agent 之间互操作通信 ,为多 Agent 通信迈出了可靠的一步。 目前 LangGraph 已经实现了该协议的超集,实现 Agent Protocol 的 Agent 系统,比如 AutoGen 可以和 LangGraph Studio 进行互操作。

    42310编辑于 2025-03-18
领券